Во многих практических ситуациях исследователю приходится принимать решение о том, какая из возможностей имеет место (продукция может быть бракованной или качественной, технологический процесс нарушается либо нет, точность обработки детали в пределах нормы, ниже нормы или выше её и т. п.). С общеметодологической точки зрения речь идет о выдвижении некоторой гипотезы, которая отвергается либо принимается после проведения некоторого эксперимента. Последний может иметь динамический либо статистический (стохастический) характер, и в этом случае говорят, что гипотеза является статистической.
Математическая постановка описанного выше процесса выглядит так.
Наблюдается
случайная величина x,
функция распределения которой F(x,q)
известна с точностью до параметра q. При этом считаем, что q принимает значение из
некоторого множества Q. Выделим в этом
множестве некоторую подобласть, Q0Ì Q. Статистическая гипотеза состоит в
том, что истинное значение параметра принадлежит Q0 . Решение о
принятии либо отклонении гипотезы принимается на основании ряда наблюдений над
значениями x,
то есть на основании выборки
.
В различных конкретных ситуациях эта задача решается по-разному, к обзору которых мы и перейдем.
·
Проверка простой гипотезы
против простой альтернативы
Выделим во множестве Q всех возможных значений два одноэлементных подмножества Q0={q0} и Q1={q1}. Относительно истинного параметра выдвинем две гипотезы: «нулевую», состоящую в том, что q = q0, и «альтернативу», состоящую в том, что q = q1 соответственно. В этом частном случае гипотезы называют простыми.
Как
уже говорилось, принятие или отклонение гипотезы Но производится на основании статистической выборки
. Общее правило при этом выглядит следующим образом. Пусть
множество всех возможных выборок. Разобьем Х на два непересекающихся подмножества W и
Q : Х = WÈQ, WÇQ = Æ.
Если оказывается, что
, гипотеза Но отклоняется
(по этой причине W называют критической
областью критерия), если же
, гипотеза принимается.
В
силу того, что производимый эксперимент является стохастическим, выборочная
точка
может оказаться в
обеих областях, W и Q,
независимо от того, верна ли нулевая гипотеза или альтернатива, что приводит к
необходимости рассматривать различные возможности ошибочных решений.
Ошибкой первого рода называют решение об отклонении гипотезы Но в то время как она верна;
Ошибкой второго рода называют решение о принятии гипотезы Но в то время как она ошибочна.
С ошибками первого и второго рода связаны их вероятности:
обозначим a вероятность ошибки первого рода
,
и b - вероятность ошибки второго рода
,
где
означает вероятность события А, вычисленную по функции
распределения F(x,q).
Пусть
случайная величина x
обладает плотностью f(x,q).
Тогда совместная плотность выборки равна произведению плотностей,
, и вероятности ошибок вычисляются по формулам
![]()
и

соответственно.
Если же x дискретна с распределением f(x,q), то совместное распределение выборки имеет тот же вид, но интегралы в предыдущих формулах следует заменить кратными суммами.
Очевидно, что a и b на самом деле зависят от выбора критической области W и, желая уменьшить, например, вероятность ошибки первого рода сужением W, мы в то же время увеличиваем вероятность ошибки второго рода.
Рассмотрим следующий пример.
Пример 26.1. Поставщик электрических лампочек считает, что надежность его товара (вероятность того, что лампочка будет гореть в течение нормативного периода) равна 0,8. Потребитель же считает, что надежность равна 0,6.
В примере речь идет об испытании простой гипотезы Но: q = 0,6 против альтернативы Н1: q = 0,8 , где q - надежность электролампы.
Р е ш е н и
е.
С целью проверки нулевой гипотезы потребитель испытывает 10 лампочек и отвергает ее, если из них по меньшей мере 7 не выходят из строя в течение нормативного срока «жизни».
Пространство выборок состоит из 210 = 1024 строчек длинны 10, состоящей из символов 0 и 1 (0 означает, что лампа бракована, 1 - годна). Критическая область W состоит из тех строк, которые содержат не меньше 7 символов 1.
Вероятность ошибки первого рода ( то есть ошибки, состоящей в том, что потребитель считает партию бракованной, в то время как она доброкачественна) равна
.
Вероятность ошибки второго рода ( состоит в том, что потребитель принимает бракованную партию) равна
.
Выберем критическую область несколько иначе: пусть W/ состоит из тех строк, которые имеют в себе не менее 8 символов 1. Тогда вероятности ошибок примут иные значения:
,
. u
Поскольку одновременно уменьшить вероятности ошибок первого и второго рода невозможно, поступают следующим образом.
Фиксируют ошибку первого рода a и подбирают из всех критических областей с данной a ту, для которой вероятность ошибки второго рода минимальна, или, что то же самое, максимальна мощность критерия, равная по определению 1 - b.
В случае, когда существует плотность f(x,q), для нахождения такого наиболее мощного критерия пользуются фундаментальной леммой Неймана - Пирсона.
Лемма. (Неймана-Пирсона). Критическая область критерия наибольшей мощности определяется так:
,
где число Кa выбирается так, чтобы вероятность ошибки первого рода равнялась a.
Доказательство леммы мы приводить не будем, рассмотрим пример.
Пример 26.2. Детали изготовляются на двух равноточных станках, каждый из которых обладает своей систематической погрешностью. Отклонение размера изготовленной детали от эталонной подчиняется нормальному закону. На склад поступает партия деталей, изготовленных одним станком. Требуется выяснить, каким именно станком она выполнена.
Обозначим x отклонение размера детали от эталона. Условия примера означают, что случайная величина x распределена по нормальному закону, параметры которого таковы: математическое ожидание может принимать два значения q0 либо q1 (различные систематические погрешности), а дисперсия одна и та же (станки равноточные), примем ее за 1. Пусть для определенности q0 > q1
Речь идет о проверке гипотезы Но: q = qо при альтернативе Н1: q = q1 относительно параметра плотности
.
Неравенство из леммы Неймана-Пирсона примет вид

Прологарифмировав обе части его, придем к виду:
,
где
.
Поскольку
проделанные преобразования эквивалентны, можно вместо отыскания Кa искать
, не интересуясь конкретной связью между ними.
Зададим
размер критерия a
и вычислим
исходя из равенства
.
Поскольку
независимы и
нормальны, то случайная величина
(выборочное среднее) подчинена нормальному закону с
параметрами (
), то есть
.
Сделав замену
, приходим к равенству:
.
Если
обозначить
корень уравнения
, решаемого приближенно с помощью таблицы (прил. 2), получаем
окончательно выражение для
:
.
Итак,
если выборочное среднее превышает
, гипотезу Но следует отвергнуть (детали изготовлены, итак, вторым станком).
Оказывается,
для построения наиболее мощного критерия вовсе не требуется задавать
критическую область в пространстве Х всех выборок - она приводится к полупрямой
[
,+¥)
на числовой оси, где откладываются значения выборочного среднего. u
Сделаем важное замечание относительно выбора размера критерия a.
На практике его выбирают так, чтобы событие, имеющее вероятность a, можно было считать «физически» невозможным, крайне редким.
·
Проверка гипотез о
параметрах нормального закона
В предыдущем разделе изучался вопрос о проверке простой гипотезы при простой альтернативе: множество параметров, соответствующее каждой из них, состоит из одной точки.
Гипотеза, которой соответствует множество параметров, состоящее более чем из одной точки, называется сложной. Общей теории проверки гипотез, когда хотя бы одна из них сложная, не существует. Мы ограничимся рассмотрением некоторых частных случаев, связанных с гипотезами о параметрах нормального закона.
Пример 26.3. Гипотеза о значении математического ожидания нормального закона при известной дисперсии.
Проверяется простая гипотеза Но: q = qо о параметре нормального закона с плотностью

против сложной альтернативы Н1: q ¹ qо.
Известно
из предыдущего, что выборочное среднее в выборке из нормального закона с
параметрами (
) имеет нормальное распределение с параметрами (
), поэтому в рассматриваемом примере нормированное выборочное
среднее
при условии, что
гипотеза Но верна, будет иметь нормальное
распределение с параметрами (0,1). u
Используя этот факт, можно построить критерий для проверки гипотезы следующим образом.
1. Выберем размер критерия a;
2.
Вычислим число
, исходя из равенства
,
то есть
есть корень уравнения
Ф(
) =
, решаемого с помощью таблицы значений Ф(z) (прил. 2);
3. Вычислим по выборке
, а затем статистику
;
4. Если выполняется равенство
, то в силу принципа физической невозможности, гипотезу Но следует отвергнуть.
Численный
пример. Точность обработки детали характеризуется среднеквадратическим
отклонением (взятым из государственного стандарта) s = 1. Отклонение размера
детали от нормативного, равного 20, подчиняется нормальному распределению. В
результате измерения 25 деталей, изготовленных станком, получено выборочное
среднее
= 19,85. Требуется
проверить на уровне значимости a = 0,01 гипотезу о том, что средний размер детали
соответствует нормативному. По таблице (прил.2) находим
. Поскольку
и 1,25<2,576 , то
нулевая гипотеза принимается. u
Пример 26.4. Проверка гипотезы о равенстве средних двух независимых нормально распределенных случайных величин.
Пусть
имеем две независимые нормальные случайные величины x и h, распределенные с
параметрами (
) и (
), причем s будем считать известным.
Требуется проверить сложную нулевую гипотезу Но: q1 = q2 при сложной альтернативе Н1: q1 ¹ q2 .
Обозначим (х1,х2,...,хn), (у1,у2,...,уn) выборки из законов x , h соответственно.
В
предположениях примера случайная величина
подчиняется
нормальному закону с параметрами (
), а нормированная разность
имеет нормальное
распределение с параметрами (0,1).
В предположении, что гипотеза Но справедлива, статистика z принимает вид
.
Дальнейшие рассуждения аналогичны рассуждениям примера 26.3.
1. Выбираем размер критерия a.
2.
Выбираем число
.
3. Вычисляем по выборке
,
, z.
4. Если
, то Но отклоняется.
Численный
пример. Сравниваем два теодолита, каждый из которых имеет заданное
стандартом среднеквадратическое отклонение 0,3°. Отклонения в измерениях
угла от истинного его значения подчиняются нормальному закону. Произведено
соответственно 25 и 50 измерений первым и вторым теодолитом, вычислены
соответственно выборочные средние
=
= 9,79°,
= 9,60°. На
уровне значимости a
= 0,01 выяснить, отличаются ли теодолиты.
Как
и в примере 26.3,
.
Значение статистики
.
Поскольку 2,586 > 2.576 , гипотеза о том, что теодолиты не отличаются, должна быть отвергнута. u
З а м е ч а н
и е. Однако следует отметить,
что для значений
еще нельзя утверждать,
что гипотеза подтвердилась:
можно только признать допустимость гипотезы для
рассмотренных выборочных наблюдений до тех пор, пока более обстоятельные
исследования не позволят сделать противоположное заключение.
Следовательно,
с помощью проверки статистических гипотез можно лишь отвергнуть проверяемую гипотезу, но никогда нельзя доказать ее
справедливость.
До сих пор мы предполагали, что вид функции распределения случайной величины x известен. Такое знание может быть получено из предыдущего опыта или по результатам аналогичных исследований других авторов.
Однако в любом случае такое знание нельзя считать точным, а лишь исходным материалом для последующего изучения с учетом конкретных обстоятельств явления, находящегося в рассмотрении.
Задача ставится следующим образом.
Изучается случайная величина x, относительно которой выдвигается гипотеза о том, что ее функция распределения есть F(x).
Критерии, предназначенные для проверки такой гипотезы, называются критериями согласия.
Мы изложим один из них, называемый критерием c2 (хи-квадрат) или критерием К. Пирсона по имени его автора.
Разобьем
множество всех возможных значений случайной величины x точками
, в результате получим r
интервалов
.
Имея
статистическую выборку
, вычислим числа
, представляющие собой количества выборочных наблюдений,
попавших в первый, второй, ..., r-й
интервал. Разумеется,
.
Считая, что поверяемая гипотеза верна, вычислим вероятности попадания случайной величины x в указанные выше интервалы (функцию распределения считаем непрерывной):
.
В
силу закона больших чисел следует ожидать, если гипотеза верна, что частоты
близки к Рi, на этой
идее и основан критерий.
Рассмотрим статистику
.
В
курсах математической статистики доказывается, что статистика c2 при n®¥ стремится
к случайной величине, распределенной по закону
с r-1 степенями
свободы, плотность которого имеет вид

Значения
интеграла
табулированы для
различных значений r
(прил. 4).
Также
доказывается, что если по выборке оценено k параметров для уточнения вида F(x), то предельным будет распределение
, где l = r - k-
1 число степеней
свободы .
Критерий согласия строится следующим образом.
1. Выбираем уровень значимости a;
2.
По таблице прил. 4 по данным r (и k, если по выборке оценивается несколько параметров) и a
находим число
(
) такое, что
,
или
.
3. По выборке находим числа ni, вычисляем Рi и статистику c2 ;
4.
Если выполнено
>
(
>
), то гипотеза о согласии выборочных наблюдений с законом F(x) отвергается.
Пример 27.1. Для выяснения того, хорошо ли отбалансирована стрелка компаса, 500 раз произведено следующее исследование: по концу стрелки производится удар и после ее остановки измеряется угол между начальным и конечным положением, отсчитываемый против движения часовой стрелки.
Все возможные значения угла (от 0° до 360°) разбиты на 12 равных интервалов, выборочные данные сгруппированы, в результате чего получена таблица
Таблица 27.1
|
Интер валы |
Г р а д у с ы |
|||||||||||
|
|
0-30 |
30-60 |
60-90 |
90-120 |
120-150 |
150-180 |
180-210 |
210-240 |
240-270 |
270-300 |
300-330 |
330-360 |
|
ni |
41 |
34 |
54 |
39 |
49 |
45 |
41 |
33 |
37 |
41 |
47 |
39 |
Требуется проверить на уровне значимости a =0,1 гипотезу о том, что угол между начальным и конечным положением стрелки распределен равномерно на отрезке [0° , 360°].
Согласно гипотезе вероятности Рi все равны между собой,
![]()
По таблице прил. 4 для 11 степеней свободы и a = 0,1 находим
=
17,3.
Вычисляем
по выборочным данным значение статистики
, которое оказывается равным 9,9966. Поскольку
9,9966<17,3, гипотеза о равномерности распределения принимается. u